วิธีการสร้าง Dataset จาก CSV ใน QuickSight
ครั้งนี้ ผมจะมาแนะนำวิธีการสร้าง Dataset จาก CSV ใน QuickSight ซึ่งจะใช้แค่ไฟล์ CSV ที่ชื่อว่า Order ในการ Upload
สิ่งที่ต้องมี
ต้องสมัครบัญชี QuickSight ใน AWS ก่อน สามารถสมัครตามลิงก์ด้านล่างนี้ได้เลย
- การสมัครบัญชี QuickSight ใน AWS
ถ้าสมัครเรียบร้อยแล้ว สามารถเริ่มทำการสร้าง Dataset จาก CSV ได้เลย
วิธีการสร้าง Dataset จาก CSV
ในการ Upload ครั้งนี้ จะใช้ไฟล์ CSV ที่ชื่อว่าorders
สามารถดาวน์โหลดไฟล์ได้ที่ orders.csv
ในส่วนหัวข้อบรรทัดที่ 1 (header) ที่อยู่ในไฟล์ Excel จะเปลี่ยนเป็น Field ของ QuickSight สีเขียวด้านซ้ายมือ และเนื้อหาข้อมูลจะแสดงในพื้นที่สีแดงด้านล่าง
QuickSight จะเปลี่ยนข้อมูลบรรทัดที่ 1 (header) ของ Excel เป็น Field ตัวอย่างเช่น id, customer_id, order_no และอื่นๆ เป็นต้น
ทีนี้เราจะมาเริ่มต้นการสร้าง Dataset กัน โดยเลือกDatasets
และคลิกNew dataset
เลือกUpload a file
ไปที่เก็บไฟล์ของคุณ ไฟล์ของผมจะอยู่ที่Downloads
คลิกEdit settings and prepare data
นี่คือหน้าตาของ Edit settings and prepare data ที่เป็นของ Order ที่ได้ Upload มาเมื่อสักครู่นี้
เราสามารถทำการตั้งค่า หรือกำหนดค่าต่างๆ ในหน้านี้ได้ เช่นการเพิ่มไฟล์, การ Join Data, การ Exclude field หรือ Include field เป็นต้น
วิธีการเปลี่ยน Data Type
ก่อนที่จะทำการเปลี่ยน Data Type ต้องทำความเข้าใจก่อน จึงจะสามารถเลือกประเภทให้เหมาะสมกับ Field ที่เราจะใช้เก็บข้อมูลได้
ข้อมูลที่ทำการโหลดเข้ามาแล้วในแต่ละ Field นั้น ระบบจะตั้งค่า Data Type โดยอัตโนมัติ
Data Type มีอยู่ 4 ประเภทหลักๆ
1. Integer (การเก็บข้อมูลแบบตัวเลข)
2. Decimal (การเก็บข้อมูลตัวเลขที่มีจุดทศนิยม)
3. String (การเก็บข้อมูลแบบตัวอักษร)
4. Date (การเก็บข้อมูลแบบวันที่)
การเปลี่ยน Data Type สามารถทำได้ 2 วิธีดังนี้
① การเปลี่ยน Data Type ในช่อง Dataset
เลือก Field ที่ต้องการเปลี่ยน Data Type ในตัวอย่างคือจะเปลี่ยน order_no จาก Integer เป็น Decimal จากนั้นคลิกที่Integer
คลิกที่Decimal
จะเห็นว่า Data Type ของ order_no เปลี่ยนเป็น Decimal แล้ว
② การเปลี่ยน Data Type ในช่อง Fields
คลิกที่⋯
ตามด้วยเลือกChange data type ﹥
และเลือกDecimal
การเปลี่ยน Data Type เราต้องเลือกประเภทให้เหมาะสมกับ Field ที่เราจะใช้เก็บข้อมูล เช่นถ้า order_type เก็บข้อมูลเป็นตัวอักษร ก็ต้องใช้ String
แต่ถ้าเราเปลี่ยน Data Type ของ order_type จาก String เป็น Integer ก็จะเกิด Error เหมือนกับรูปภาพ
การ Exclude field และ Include field
Exclude field คือ การนำ field นั้นๆ ออกจากการแสดงผลข้อมูลในตาราง ในกรณีที่เราไม่ต้องการใช้งาน field นั้น
Include field คือ การนำ field ที่ต้องการแสดงผลมาเปิดการใช้งาน
ผมจะใช้ Field ที่ชื่อว่าcost
มายกตัวอย่างในการ Exclude field และ Include field ในกรณีต่างๆ
ในกรณีที่ไม่ต้องการใช้งาน cost
ให้ดูที่ Field ด้านขวามือ จะเห็นว่ามีข้อมูลแสดงอยู่ จากนั้นให้คลิกที่⋯
ของไฟล์cost
ตามด้วยเลือกExclude field
จะเห็นว่าcost
ลงมาอยู่ในช่องของ Exclude field และให้ดูที่ตารางด้านขวามือ จะเห็นว่าข้อมูลcost
ได้หายไปแล้ว
ในกรณีที่ต้องการนำ cost กลับมาใช้งาน
ให้คลิกที่⋯
ของไฟล์cost
ตามด้วยเลือกInclude field
จะเห็นว่าcost
กลับขึ้นมาอยู่ในช่องของ Fields แล้ว ทีนี้ให้ดูที่ตารางด้านขวามือ จะเห็นว่ามีข้อมูลของcost
กลับมาด้วย
ถ้าทำการตั้งค่าเสร็จเรียบร้อยทั้งหมดแล้ว ให้คลิกที่Save and Publish
และCancel
ได้เลย
เพียงเท่านี้เราก็ได้ Dataset ที่ชื่อว่าOrders
ของเรามาแล้ว
สรุป
เราสามารถ upload ไฟล์ CSV หรือไฟล์อื่นๆ เข้ามายัง Dataset เพื่อใช้ในการสร้าง Dashboards ให้สามารถวิเคราะห์ข้อมูลเชิงลึกที่ต้องการได้